Die Document Suite - XML-basierte Sprachverarbeitung als Basistechnologie für das 'Semantic Web'

نویسندگان

  • Dietmar F. Rösner
  • Manuela Kunze
چکیده

Die ‘Document Suite’ ist eine Sammlung von Werkzeugen für die verschiedenen Aufgaben beim Erschließen der Inhalte von elektronisch verfügbaren Dokumenten aus dem WWW oder aus anderen Dokumentbeständen. Bei ihrer Konzeption und Realisierung wurde konsequent darauf gesetzt, die Vorteile von XML und die der zugehörigen Formalismen und Werkzeuge auszunutzen: alle Module der ‘Document Suite’ erwarten XML-Dokumente als Eingabe und liefern ihre Resultate in XML-Format. Desweiteren werden alle Ressourcen (z.B. Lexika, Grammatikregeln, semantische Zuordnungen, Topic Maps, ..) einheitlich in XML kodiert.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

CLab - eine web-basierte interaktive Lernplattform für Studierende der Computerlinguistik

Inhaltlich lässt sich das CLab als eine Sammlung von thematisch selbstständigen Modulen beschreiben zu Themen wie „Reguläre Ausdrücke“, „Tokenisierung“, „Chunking“ oder „Satzähnlichkeit“. Diese Module werden Lerneinheiten genannt. Jede Lerneinheit basiert auf einem Lehrtext (PDF), welcher die inhaltliche Grundlage bildet. Er kann ausgedruckt, durchgearbeitet und leicht durchsucht werden. Letzte...

متن کامل

Modulare Spezifikation und Steuerung von Dialogen in web-baiserten Anwendungen

Die Benutzerfreundlichkeit von Web-Anwendungen leidet häufig unter der fehlenden Unterstützung hierarchischer Dialogsequenzen, an die Benutzer sich während der Arbeit mit fensterbasierten Benutzeroberflächen und ihren hierarchisch strukturierten Dialogfenstern bereits gewöhnt haben. Für Multikanal-Anwendungen liegt eine zusätzliche Herausforderung darin, die geräteunabhängige Geschäftslogik mit...

متن کامل

Prozessmodell-basierte Präsentation von Produktionsfehler-Beschreibungen

Zusammenfassung Im Projekt CeraNet wurde ein System entwickelt, das Informationen über Fehlerursachen und Fehlerphänomene bei der Keramikproduktion im Web präsentiert. Zentrale Idee von CeraNet ist die Modellierung der Prozesse und die Verknüpfung der Fehlerbeschreibungen mit den Modellen, um einen Zugang zu den Fehlern auch über die Prozesse zu ermöglichen. In CeraNet wurde eine Redakteurssoft...

متن کامل

Ein XML-basiertes Datenbanksystem für digitale Wörterbücher - Ein Werkstattbericht aus dem Institut für Deutsche Sprache (An XML-Based Database System for Online Dictionaries - A Report on Lexicographic Work at the Institute for German Language)

Zusammenfassung Das Online-Wortschatz-Informations-system Deutsch (OWID) ist ein digitales Wörterbuchportal des Instituts für Deutsche Sprache. Alle darin zusammengeführten lexikografischen Daten sind auf XML-Basis feingranular struk-turiert. Speicherung, Verwaltung und Retrieval dieser Daten übernimmt das Oracle-basierte Electronic Dictionary Administration System (EDAS). Der vorliegende Beitr...

متن کامل

XML als Basistechnologie für das Content Management integrierter Medienprodukte

Die Medienindustrie befindet sich derzeit in einer technisch induzierten Umbruchphase. Neben die klassischen Medien wie etwa Print und Rundfunk treten die neuen, auf digitalen Technologien beruhenden Medien wie etwa das Internet und das digitale Fernsehen. Die durchgehende Digitalisierung bei der Erzeugung, Bündelung und Distribution von Inhalten ermöglicht dabei vielfältige Ansatzpunkte zur In...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2002